1 Introduction

Dans le monde, on compte plus de 800 millions de personnes vivant à proximité d’un volcan dont 200 millions à moins de 30 km d’un volcan actif (CNRS, 2025). La caractérisation de l’aléa volcanique est donc essentielle pour la sureté des habitants en territoires volcaniques. Cela passe notamment par la compréhension de lien divers entre un volcan et le type de dépôts ou l’intensité éruptive qu’il produit. Notre étude se concentre sur la région méditerranéenne, en particulier sur deux édifices grecs et quatre édifices italiens, ces deux pays étant particulièrement connues pour leurs volcanismes très actifs et notamment plusieurs éruptions historiques. Les volcans italiens sont l’Etna (Sicile, Italie), le Vésuve (Naples, sud de l’Italie), Lipari et Vulcano (Iles Eoliennes, Sicile, Italie). Les volcans grecques sont le Santorin et le Nisyros (Iles Dodecanese, Grèce). Ici nous ne nous concentrerons que sur la période 2015 à 2025.

Nous avons les données de magnitudes, types de magma, profondeur du magma, le VEI, la classification et le volume estimé de produits pour chaque édifice volcanique en plus des coordonnées des éruptions pour chaque édifices. L’objectif est de comprendre si il existe un lien entre intensité de l’éruption (magnitude) et l’édifice volcanique afin de déterminer quelle population s’expose à un risque plus important. Il sera aussi particulièrement intéressant de regarder le lien possible entre volcans et type de magma car le risques lié à un volcan est en partie du au type de matériaux qu’il produit. Ces résultats pourrait également nous permettre de déterminer si les populations d’un volcan en particulier s’exposent à un risque accrue. Enfin, d’un point de vus purement recherche nous allons nous intéressé au lien entre édifice et profondeur du magma car c’est grâce à la détection du magma en profondeur que l’on peut anticiper une éruption. Egalement à la profondeur en fonction du type de magma mais cela nous permettra, au terme d’une étude pétrologique ultérieure de prédire des temps de remonté du magma et des durées pré-éruptifs afin d’alerter la population en cas d’éruption imminente si ce lien existe.

2 Analyse exploiratoire des données

2.1 Chargement et préparation des données

## Warning: le package 'ggplot2' a été compilé avec la version R 4.3.3
## Warning: le package 'tidyr' a été compilé avec la version R 4.3.3
## Warning: le package 'performance' a été compilé avec la version R 4.3.3
## Warning: le package 'car' a été compilé avec la version R 4.3.3
## Warning: le package 'carData' a été compilé avec la version R 4.3.3
## Warning: le package 'maps' a été compilé avec la version R 4.3.3
## Warning: le package 'sf' a été compilé avec la version R 4.3.3
## Warning: le package 'prettymapr' a été compilé avec la version R 4.3.3
## Warning: le package 'rnaturalearthdata' a été compilé avec la version R 4.3.3
## Warning: le package 'viridis' a été compilé avec la version R 4.3.3
## Warning: le package 'patchwork' a été compilé avec la version R 4.3.3
## Warning: le package 'geosphere' a été compilé avec la version R 4.3.3
## Warning: le package 'reshape2' a été compilé avec la version R 4.3.3
## Warning: le package 'cowplot' a été compilé avec la version R 4.3.3
## Warning: le package 'factoextra' a été compilé avec la version R 4.3.3
## Warning: le package 'FactoMineR' a été compilé avec la version R 4.3.3
## Warning: le package 'plotly' a été compilé avec la version R 4.3.3
## Warning: le package 'PerformanceAnalytics' a été compilé avec la version R
## 4.3.3
## Warning: le package 'xts' a été compilé avec la version R 4.3.3
## Warning: le package 'zoo' a été compilé avec la version R 4.3.3
## Warning: le package 'ade4' a été compilé avec la version R 4.3.3
## Warning: le package 'pheatmap' a été compilé avec la version R 4.3.3
## Warning: le package 'ggsci' a été compilé avec la version R 4.3.3
## 'data.frame':    47 obs. of  14 variables:
##  $ Volcanoes       : chr  "Santorin" "Santorin" "Santorin" "Santorin" ...
##  $ Event.ID        : int  11946380 11933823 11933599 11933364 11405253 10724958 10878280 10813622 10813590 10757351 ...
##  $ Date            : chr  "12-02-25" "09-02-25" "09-02-25" "08-02-25" ...
##  $ Time            : chr  "08:37:47" "18:53:57" "01:35:15" "09:24:02" ...
##  $ Latitude        : num  36.4 36.4 36.5 36.4 36.4 ...
##  $ Longitude       : num  25.5 25.5 25.5 25.5 25.5 ...
##  $ Depth           : num  10 10 10 10 10 10 17.6 3.3 0 3.8 ...
##  $ Mag.Type        : chr  "MA" "MA" "MA" "MA" ...
##  $ Magnitude       : num  4.3 4.7 4.5 4.6 4.2 4.2 1.4 1.3 1.2 1.9 ...
##  $ Volume          : num  7.98e+07 2.00e+08 1.26e+08 1.59e+08 6.34e+07 ...
##  $ VEI.approximatif: int  3 3 3 3 3 3 1 1 1 1 ...
##  $ Region          : chr  "DODECANESE ISLANDS" "DODECANESE ISLANDS" "DODECANESE ISLANDS" "DODECANESE ISLANDS" ...
##  $ Country         : chr  "GREECE" "GREECE" "GREECE" "GREECE" ...
##  $ Classification  : chr  "Vulcanien" "Vulcanien" "Vulcanien" "Vulcanien" ...
##     Volcanoes      Event.ID      Date               Time          
##  Etna    : 7   10796353: 2   Length:47          Length:47         
##  Lipari  : 9   11629587: 2   Class :character   Class :character  
##  Nisyros :11   5112637 : 1   Mode  :character   Mode  :character  
##  Santorin:13   5149922 : 1                                        
##  Vesuvio : 1   10570434: 1                                        
##  Vulcano : 6   10570525: 1                                        
##                (Other) :39                                        
##     Latitude       Longitude         Depth         Mag.Type    Magnitude   
##  Min.   :36.32   Min.   :14.49   Min.   :  0.00   MA   :14   Min.   :1.20  
##  1st Qu.:36.45   1st Qu.:14.96   1st Qu.:  7.20   MB   :19   1st Qu.:1.80  
##  Median :36.67   Median :25.39   Median : 10.00   MB-MA: 3   Median :2.30  
##  Mean   :37.40   Mean   :20.70   Mean   : 27.57   MBa  : 1   Mean   :2.76  
##  3rd Qu.:38.39   3rd Qu.:25.51   3rd Qu.: 14.91   ML   : 9   3rd Qu.:4.20  
##  Max.   :40.79   Max.   :27.25   Max.   :225.42   MR   : 1   Max.   :5.30  
##                                                                            
##      Volume          VEI.approximatif                Region     Country  
##  Min.   :    63396   1:24             DODECANESE ISLANDS:24    ITALY:23  
##  1st Qu.:   252383   2: 9             SICILY            :22   GREECE:24  
##  Median :   798105   3:13             SOUTHERN          : 1              
##  Mean   : 50123635   4: 1                                                
##  3rd Qu.: 63395728                                                       
##  Max.   :798104926                                                       
##                                                                          
##                Classification
##  Hawaien/Strombolien  :24    
##  Strombolien/Vulcanien: 9    
##  Vulcanien            :13    
##  Vulcanien/Plinien    : 1    
##                              
##                              
## 

## 'data.frame':    22 obs. of  14 variables:
##  $ Volcanoes       : Factor w/ 6 levels "Etna","Lipari",..: 1 1 1 1 1 1 5 6 6 6 ...
##  $ Event.ID        : Factor w/ 45 levels "5112637","5149922",..: 31 30 29 28 35 36 17 41 24 21 ...
##  $ Date            : chr  "17-08-15" "12-08-15" "12-08-15" "12-08-15" ...
##  $ Time            : chr  "02:18:26" "11:41:46" "11:35:53" "03:56:14" ...
##  $ Latitude        : num  37.7 37.8 37.8 37.8 37.7 ...
##  $ Longitude       : num  15.1 15 15 15 15.1 ...
##  $ Depth           : num  7.2 29.9 28.6 30 10 ...
##  $ Mag.Type        : Factor w/ 6 levels "MA","MB","MB-MA",..: 2 2 2 2 1 1 2 1 2 2 ...
##  $ Magnitude       : num  1.5 1.4 1.5 1.5 4.3 1.8 2.2 4.4 1.3 1.2 ...
##  $ Volume          : num  126491 100475 126491 126491 79810493 ...
##  $ VEI.approximatif: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 3 1 1 3 1 1 ...
##  $ Region          : Factor w/ 3 levels "DODECANESE ISLANDS",..: 2 2 2 2 2 2 3 2 2 2 ...
##  $ Country         : Factor w/ 2 levels " ITALY","GREECE": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Classification  : Factor w/ 4 levels "Hawaien/Strombolien",..: 1 1 1 1 3 1 1 3 1 1 ...
## 'data.frame':    24 obs. of  14 variables:
##  $ Volcanoes       : Factor w/ 6 levels "Etna","Lipari",..: 4 4 4 4 4 4 4 4 4 4 ...
##  $ Event.ID        : Factor w/ 45 levels "5112637","5149922",..: 45 44 43 42 38 16 33 23 22 18 ...
##  $ Date            : chr  "12-02-25" "09-02-25" "09-02-25" "08-02-25" ...
##  $ Time            : chr  "08:37:47" "18:53:57" "01:35:15" "09:24:02" ...
##  $ Latitude        : num  36.4 36.4 36.5 36.4 36.4 ...
##  $ Longitude       : num  25.5 25.5 25.5 25.5 25.5 ...
##  $ Depth           : num  10 10 10 10 10 10 17.6 3.3 0 3.8 ...
##  $ Mag.Type        : Factor w/ 6 levels "MA","MB","MB-MA",..: 1 1 1 1 1 1 5 5 5 5 ...
##  $ Magnitude       : num  4.3 4.7 4.5 4.6 4.2 4.2 1.4 1.3 1.2 1.9 ...
##  $ Volume          : num  7.98e+07 2.00e+08 1.26e+08 1.59e+08 6.34e+07 ...
##  $ VEI.approximatif: Factor w/ 4 levels "1","2","3","4": 3 3 3 3 3 3 1 1 1 1 ...
##  $ Region          : Factor w/ 3 levels "DODECANESE ISLANDS",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Country         : Factor w/ 2 levels " ITALY","GREECE": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Classification  : Factor w/ 4 levels "Hawaien/Strombolien",..: 3 3 3 3 3 3 1 1 1 1 ...

2.2 Calcule des paramètres de dispersions

##       Group  Variable                Variance            Mean
## 1    Global     Depth              2683.43422        27.56902
## 2    Global Magnitude                 1.56159         2.75957
## 3    Global    Volume 15973504288128854.00000  50123634.88617
## 4  Santorin     Depth                23.21269         7.44615
## 5  Santorin Magnitude                 2.25859         2.87692
## 6  Santorin    Volume  4908889462161985.00000  53385265.08462
## 7      Etna     Depth               130.90810        19.41429
## 8      Etna Magnitude                 1.07333         2.00000
## 9      Etna    Volume   905672258098802.00000  11563260.61857
## 10  Vesuvio     Depth                      NA         0.50000
## 11  Vesuvio Magnitude                      NA         2.20000
## 12  Vesuvio    Volume                      NA    633957.28000
## 13  Vulcano     Depth                10.43741         9.28700
## 14  Vulcano Magnitude                 1.36967         2.21667
## 15  Vulcano    Volume  1669085589528357.50000  17084959.71833
## 16   Lipari     Depth              8245.75305        54.22689
## 17   Lipari Magnitude                 0.84000         2.90000
## 18   Lipari    Volume  1902945411863623.50000  23549175.67556
## 19  Nisyros     Depth              3726.96190        47.16182
## 20  Nisyros Magnitude                 1.45855         3.33636
## 21  Nisyros    Volume 57457175635148752.00000 115070297.50455

En moyenne, Lipari génère des magmas qui viennent de plus profond et le Santorin les plus superficiels. Nisyros est le volcan avec le plus grand volume de produit estimé en moyenne et Vulcano emet le moins sur une même période d’activité. La magnitude des éruptions est en moyenne plus importante pour Nisyros. Cela est cohérent car la magnitude est directement reliée au volume emis, plus le volume est important plus la magnitude le sera, hors Nisyros à le volume moyen le plus important donc la magnitude moyenne la plus importante. Cependant ce n’est pas Vulcano qui possède la plus faible moyenne des magnitudes mais l’Etna. Cela peut s’expliquer par le faite que l’Etna à plus érupter sur 2015-2025 par rapport à Vulcano pour un volume moyen de débris légèrement inférieur. La moyenne des magnitudes de l’Etna pourra donc être légèrement plus faible que celle de Vulcano.

Les valeurs de variance pour le volume et la magnitude sont ccohérentes par rapport au jeu de donné mais pour la profondeur, celles-ci sont beaucoup trop grande, cela s’explique par la présence d’outlier (7 point de donnée) de valeur beaucoup trop importante ou encore bien trop faibe qui donnent une dispersion des mesures exagérée.

On remarque qur pour le Vésuve nous n’avons qu’une seule éruption. Ainsi, nous ne pouvons pas calsuler de valeurs de dispersion et la profondeurs, la magnitude et le volume moyen seront les valeurs des données de l’éruption.

##        Depth    Magnitude       Volume 
## 5.180187e+01 1.249636e+00 1.263863e+08
##     Depth Magnitude    Volume 
## 1.8789885 0.4528366 2.5214917
## # A tibble: 6 × 6
##   Volcanoes mean_mag sd_mag min_mag max_mag median_mag
##   <fct>        <dbl>  <dbl>   <dbl>   <dbl>      <dbl>
## 1 Etna          2     1.04      1.4     4.3        1.5
## 2 Lipari        2.9   0.917     1.8     4.4        2.7
## 3 Nisyros       3.34  1.21      1.9     5.3        2.8
## 4 Santorin      2.88  1.50      1.2     4.7        1.9
## 5 Vesuvio       2.2  NA         2.2     2.2        2.2
## 6 Vulcano       2.22  1.17      1.2     4.4        2

Les volcans grecs porduisent une plus large d’éruption de magnitudes différentes que les volacans Italiens et se sont égalment eux qui produisent les éruptions les plus intenses avec Lipari. Cependant, il n’y pas de grande difference entre les différents paramètres de dispersion des les volcans.

3 Graphiques des analyses univariés

3.1 Analyse univariée de la profondeur

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning in scale_y_log10(): log-10 transformation introduced infinite values.
## log-10 transformation introduced infinite values.
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_boxplot()`).
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_summary()`).

Pour l’ensemble des volcans, hormis les 7 outliers visibles en rouge sur le boxplot, la répartition des rpofondeurs sur l’hitogramme est symétique par rapport à une valeur centrale de 10 km. La majorité de nos magmas proviennet donc de chambre localsiée entre 15 et 7 km ce qui reste relativement superficielle.

3.2 Analyse univariée de la magnitude

Le boxplot ne montre pas de valeur abérente. Cependant, l’histogramme des magnitudes montre une réputation bimodale des données. Une première partie des magnitudes se situe en dessous de 3, ce sont les valeurs de magnétudes faibles et une seconde partie se trouve au-dessus de 3 avec des valeurs dites fortes.

Maintenant on regarde les histogrammes pour chacuns des modes. Les fortes magnitudes ont une distribution sysmétrique qui s’articule autour d’une valeur centrale de 4,3 tands que les faibles magnitudes suivent aussi une distribution sysméetique autour de 1,8 mais reste moins marqué et s’étale dans l’intervalle 1 à 2,2.

3.3 Analyse univariée du type de magma

## Warning in geom_bar(binwidth = 0.2, fill = "lightyellow", color = "black", :
## Ignoring unknown parameters: `binwidth`

La majorité des magmas sont basaltique (MB) avec quelques occurences andésitique (MA) et latitique (ML=un magma latitique est un magma basaltique avec une texture particulière, il n’y a pas de différence de chimie importante). La série est basic et donc faiblement différencié. En effet il n’y a quaiment pas de magma différencié rhyolique (MR). La faible présence de basalte alcalin (MBa) révelle que les magmas générés appartiennen à la série subalcaline. Enfin, il se produit un petit peu de mélande car 3 magmas on uen composition intermédiaire entre basaltique et andésitique (MB-MA).

3.4 Analyse univariée du volume estimé

Pour les volumes estimés, on montrent également une répartition bimodale tres similaire à celle des magnitudes avec une valeur intermétidaiure entre les faibles et les forts volumes de 16,25 km3. Les forts volumes s’articulent autour d’un mode de 18,7 km3 et la faibles volume autoure de 12,5 km3 mais clea reste moins symétirque et forme plus un plateau. Les volumes estimés sont utilisés pour déterminer la magnitude de l’érution, il est donc logique qu’il suivent excatement la meme distibution pour l’hitogramme et le boxplot.

3.5 Analyse univariée du VEI estimé

## Warning in geom_bar(binwidth = 0.2, fill = "lightyellow", color = "black", :
## Ignoring unknown parameters: `binwidth`

Le VEI est une échelle de 1 à 8 donnant l’intensité d’une éruption volcanique (1 tres peu intense et 8 extremement intense). Dans la région, la majorité des éruptions sont de faible intensité avec un VEI autour de 1 et 2 (plus de 30 cas), VEI 1 étant majoritaire. On enregistre des éruption peu à moyennement intense (3 à 4), mais elles restent minoritaire. Il n’y a aucune éruption avec un VEI supérieure à 4, ce qui est rassurant puisque les grosses éruptions ont une occurences de plusieurs centaines d’année et sont donc difficilement visible sur une période de 10 ans.

4 Analyse bivariés

Attention Pour les tests avec deux variables quantitatives ==> pas possible de faire un test d’anova ou un t.test. Il faut faire un test de corrélation Pour les tests avec deux variables qualitatives ==> test du chi2 Pour les test avec une variable qualitative et quantitative ==> test anova ou t.test Attention à remettre en forme correctement Pour le test d’anova ==> condition d’application il faut que les résidus soient distribués normalement. Vérifier l’indépendance des résidus, ainsi que l’homoscédasticité je pense. Pour le t.test, il faut tester la variance. Pour l’ANCOVA ce sont les mêmes conditions d’applications

Cette analyse univarié a permis de déterminer l’allure de chacune des variables du jeu données. Il est a présent possible d’étudier des liens possibles entre ces différentes données. Tout d’abord,

Lien entre la magnitude et la profondeur

normalement il n’est pas possible de faire une anova car des variables quantitatives et non quali

## [1] 0.3235965

Pas de test de kruskall-wallis car pas de variables catégorielles normalement peut pas utiliser l’anova donc il faut utiliser un autre test comme kruskal-wallis

## 
##  Kruskal-Wallis rank sum test
## 
## data:  Depth by Volcanoes
## Kruskal-Wallis chi-squared = 9.6108, df = 5, p-value = 0.08705
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Depth by Magnitude
## Kruskal-Wallis chi-squared = 31.564, df = 26, p-value = 0.2079

lien entre magnitude et le volume estimé

## 
## Call:
## lm(formula = log(Volume) ~ Magnitude, data = df)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -4.066e-08 -2.747e-09  8.390e-10  2.393e-09  2.790e-08 
## 
## Coefficients:
##              Estimate Std. Error   t value Pr(>|t|)    
## (Intercept) 8.294e+00  4.917e-09 1.687e+09   <2e-16 ***
## Magnitude   2.303e+00  1.626e-09 1.416e+09   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.378e-08 on 45 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 2.005e+18 on 1 and 45 DF,  p-value: < 2.2e-16

pas possible de faire une interprétation car R2 = 1 car directement calculé par rapport à la magnitude. C’est pour cela que la relation VEI et magnitude n’est pas pertinente car celle-ci est également tiré de la magnitude

Lien entre le volume et la profondeur pas d’anova

## [1] 0.3235965

Pas d’anova car les résidus ne sont pas distribués normalement. Utilisation du test de kruskal-wallis

## 
##  F test to compare two variances
## 
## data:  df_faible$Magnitude and df_forte$Magnitude
## F = 2.3771, num df = 31, denom df = 14, p-value = 0.0882
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.8723205 5.5180696
## sample estimates:
## ratio of variances 
##            2.37705
## 
##  Two Sample t-test
## 
## data:  df_faible$Magnitude and df_forte$Magnitude
## t = -17.059, df = 45, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.759537 -2.176713
## sample estimates:
## mean of x mean of y 
##  1.971875  4.440000

Magnitude en fonction des volcans puis Magnitude en fonction du type de magma.

## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_segment()`).
## Warning: Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé

Possible d’observer que certains groupes ont des distributions bimodal et non pas juste normal

##             Df Sum Sq Mean Sq F value Pr(>F)
## Volcanoes    5  10.14   2.027   1.347  0.264
## Residuals   41  61.70   1.505

pas de différence significative entre les magnitudes moyennes des différents volcans

## Warning: Removed 2 rows containing missing values or values outside the scale range
## (`geom_segment()`).
## Warning: Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé

il n’y a pas une distribution normale de la donnée. Certains des types de magmas ne présentent qu’une seul variable.

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  5  0.6567 0.6581
##       41

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Mag.Type     5  50.18  10.036      19 9.66e-10 ***
## Residuals   41  21.65   0.528                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_segment()`).
## Warning: Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.5679  0.211
##       43

##                Df Sum Sq Mean Sq F value Pr(>F)
## Classification  3  14896    4965   1.967  0.133
## Residuals      43 108542    2524
## Warning: Removed 2 rows containing missing values or values outside the scale range
## (`geom_segment()`).
## Warning: Groups with fewer than two data points have been dropped.
## Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  5  0.3496 0.8796
##       41

##             Df Sum Sq Mean Sq F value Pr(>F)
## Mag.Type     5  16122    3224   1.232  0.312
## Residuals   41 107316    2617
## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_segment()`).
## Warning: Groups with fewer than two data points have been dropped.
## Warning in max(ids, na.rm = TRUE): aucun argument pour max ; -Inf est renvoyé

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  5  1.2315  0.312
##       41

##             Df Sum Sq Mean Sq F value Pr(>F)
## Volcanoes    5   53.7  10.748   1.347  0.264
## Residuals   41  327.1   7.978

graphique : VEI + volcanoes

5 Analyse multivariée

Attention Pour faire des tests possible de faire ANCOVA pour quand deux variables quanti avec une variable quali

##                     Df Sum Sq Mean Sq F value Pr(>F)  
## Magnitude            1  11522   11522   4.998 0.0317 *
## Volcanoes            5  14719    2944   1.277 0.2952  
## Magnitude:Volcanoes  4  14195    3549   1.539 0.2116  
## Residuals           36  83001    2306                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

##             Df Sum Sq Mean Sq F value Pr(>F)  
## Magnitude    1  11522   11522   4.742 0.0354 *
## Volcanoes    5  14719    2944   1.211 0.3215  
## Residuals   40  97197    2430                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##           
##            MA MB MB-MA MBa ML MR
##   Etna      2  5     0   0  0  0
##   Lipari    2  7     0   0  0  0
##   Nisyros   3  1     3   1  2  1
##   Santorin  6  0     0   0  7  0
##   Vesuvio   0  1     0   0  0  0
##   Vulcano   1  5     0   0  0  0
## Warning in chisq.test(tab): L’approximation du Chi-2 est peut-être incorrecte
## Warning in chisq.test(tab1): L’approximation du Chi-2 est peut-être incorrecte
## 
##  Pearson's Chi-squared test
## 
## data:  tab1
## X-squared = 51.032, df = 15, p-value = 8.156e-06
## Warning in chisq.test(tab2): L’approximation du Chi-2 est peut-être incorrecte
## 
##  Pearson's Chi-squared test
## 
## data:  tab2
## X-squared = 20.97, df = 15, p-value = 0.1378
## Warning in chisq.test(tab3): L’approximation du Chi-2 est peut-être incorrecte
## 
##  Pearson's Chi-squared test
## 
## data:  tab3
## X-squared = 20.97, df = 15, p-value = 0.1378

5.1 AFC

##           
##            MA MB MB-MA MBa ML MR
##   Etna      2  5     0   0  0  0
##   Lipari    2  7     0   0  0  0
##   Nisyros   3  1     3   1  2  1
##   Santorin  6  0     0   0  7  0
##   Vesuvio   0  1     0   0  0  0
##   Vulcano   1  5     0   0  0  0
## Warning in chisq.test(tab): L’approximation du Chi-2 est peut-être incorrecte

## Warning in chisq.test(tab1): L’approximation du Chi-2 est peut-être incorrecte

##                        
##                         Etna Lipari Nisyros Santorin Vesuvio Vulcano
##   Hawaien/Strombolien      6      2       4        7       1       4
##   Strombolien/Vulcanien    0      5       3        0       0       1
##   Vulcanien                1      2       3        6       0       1
##   Vulcanien/Plinien        0      0       1        0       0       0
## Warning in chisq.test(tab2): L’approximation du Chi-2 est peut-être incorrecte

5.2 ACM

## ACP Pas énormément de pertinence étant donnée qu’il n’y a que 3 variables

## List of 13
##  $ tab :'data.frame':    47 obs. of  3 variables:
##   ..$ Depth    : num [1:47] -0.343 -0.343 -0.343 -0.343 -0.343 ...
##   ..$ Magnitude: num [1:47] 1.25 1.57 1.41 1.49 1.17 ...
##   ..$ Volume   : num [1:47] 0.237 1.202 0.611 0.873 0.106 ...
##  $ cw  : num [1:3] 1 1 1
##  $ lw  : num [1:47] 0.0213 0.0213 0.0213 0.0213 0.0213 ...
##  $ eig : num [1:3] 1.744 0.943 0.313
##  $ rank: int 3
##  $ nf  : int 3
##  $ c1  :'data.frame':    3 obs. of  3 variables:
##   ..$ CS1: num [1:3] -0.347 -0.691 -0.634
##   ..$ CS2: num [1:3] 0.904 -0.0666 -0.4224
##   ..$ CS3: num [1:3] 0.25 -0.719 0.648
##  $ li  :'data.frame':    47 obs. of  3 variables:
##   ..$ Axis1: num [1:47] -0.893 -1.728 -1.241 -1.463 -0.754 ...
##   ..$ Axis2: num [1:47] -0.493 -0.922 -0.662 -0.778 -0.432 ...
##   ..$ Axis3: num [1:47] -0.828 -0.435 -0.703 -0.591 -0.855 ...
##  $ co  :'data.frame':    3 obs. of  3 variables:
##   ..$ Comp1: num [1:3] -0.458 -0.913 -0.837
##   ..$ Comp2: num [1:3] 0.8778 -0.0646 -0.4101
##   ..$ Comp3: num [1:3] 0.14 -0.402 0.363
##  $ l1  :'data.frame':    47 obs. of  3 variables:
##   ..$ RS1: num [1:47] -0.676 -1.309 -0.94 -1.108 -0.571 ...
##   ..$ RS2: num [1:47] -0.508 -0.95 -0.681 -0.801 -0.445 ...
##   ..$ RS3: num [1:47] -1.481 -0.778 -1.256 -1.057 -1.529 ...
##  $ call: language dudi.pca(df = df_num, scannf = FALSE, nf = ncol(df_acp))
##  $ cent: Named num [1:3] 2.76e+01 2.76 5.01e+07
##   ..- attr(*, "names")= chr [1:3] "Depth" "Magnitude" "Volume"
##  $ norm: Named num [1:3] 5.12e+01 1.24 1.25e+08
##   ..- attr(*, "names")= chr [1:3] "Depth" "Magnitude" "Volume"
##  - attr(*, "class")= chr [1:2] "pca" "dudi"
## Class: pca dudi
## Call: dudi.pca(df = df_num, scannf = FALSE, nf = ncol(df_acp))
## 
## Total inertia: 3
## 
## Eigenvalues:
##     Ax1     Ax2     Ax3 
##  1.7443  0.9428  0.3128 
## 
## Projected inertia (%):
##     Ax1     Ax2     Ax3 
##   58.14   31.43   10.43 
## 
## Cumulative projected inertia (%):
##     Ax1   Ax1:2   Ax1:3 
##   58.14   89.57  100.00
## [1] 3

5.3 Clustering

##   Group.1    Volume    Depth Magnitude
## 1       1 798104926  5.47000  5.300000
## 2       2 204033567 54.10000  4.700000
## 3       3  89117804 46.76740  4.330000
## 4       4   1649308 20.00909  2.030303

Possible de faire aussi des calculs pour estimé après c’est vraiment juste pour dire de l’avoir fait et pas vraiment une aide dans le travail en soit

Attention demander à madame au prochain cours les petites questions que j’ai au sujet des tests